我们分析了Bachoc等人的二元搜索算法的累积遗憾。[2022]。
translated by 谷歌翻译
本文通过顺序查询其值来最大程度地限制单变量凸功能$ f $的自然概括。在每个时间段$ t $中,优化器都可以在查询点上投资预算$ b_t $,以获取其选择的$ x_t $,以获取对$ f $ at $ x_t $的模糊评估,其准确性取决于投资预算的金额在$ x_t $中遍布时间。此设置是由目标最小化的动机,这些目标只能通过冗长或昂贵的计算来确定其值。我们设计了一种称为二元搜索的任何无时间参数算法,我们证明了几乎最佳的优化错误保证。作为我们分析的副产品,我们表明,在误差范围中对全球Lipschitz常数的经典依赖性是预算粒度的伪像。最后,我们通过数值模拟说明了我们的理论发现。
translated by 谷歌翻译
我们研究供应商和零售商之间的重复游戏,他们希望在不了解问题参数的情况下最大化各自的利润。在用完整的信息表征了舞台游戏的Stackelberg平衡的独特性之后,我们表明,即使有部分了解需求和生产成本的联合分配,自然学习动态也可以保证供应商和零售商共同策略概况的收敛,舞台游戏的平衡。我们还证明了供应商对零售商的遗憾的遗憾和渐近界限的有限时间界限,在该零售商的遗憾中,特定费率取决于玩家初步可用的知识类型。在特殊情况下,当供应商不是战略性的(垂直整合)时,我们证明,当成本和需求是在对抗性和需求时,零售商的遗憾(或等同于社会福利)对零售商的遗憾(或等效地是社会福利)的最佳遗憾。
translated by 谷歌翻译
在本文中,我们向空间运营领域的专家建议介绍了在线学习的现实应用,并对来自哥白尼Sentinel-6卫星的现实生活数据进行了测试。我们表明,与传统技术相比,在航天器内存转储优化的优化中,一种轻巧的跟随算法会导致性能的增加超过60 \%$。
translated by 谷歌翻译
我们调查了一个非旋转的强盗设置,其中不立即向玩家充满行动的丢失,而是以普遍的方式蔓延到后续轮。通过每轮末端观察到的瞬时损失是先前播放动作的许多损耗组件的总和。此设置包括一个特殊情况,该特例是具有延迟反馈的匪徒的特殊情况,是播放器单独观察延迟损耗的良好反馈。我们的第一个贡献是将标准强盗算法转换为可以在更难的设置中运行的一般减少:我们在原始算法的稳定性和后悔方面绑定了转换算法的遗憾。然后,我们表明,使用Tsallis熵的适当调谐的ftrl的转换具有令人遗憾的$ \ sqrt {(d + 1)kt} $,其中$ d $是最大延迟,$ k $是武器数量,$ t $是时间范围。最后,我们表明我们的结果通常不能通过在此设置中运行的任何算法的遗憾上展示匹配(最多一个日志因子)下限。
translated by 谷歌翻译
我们在合作在线学习环境中研究反馈与沟通之间的相互作用,在该环境中,代理网络解决了一项任务,其中学习者的反馈由任意图确定。我们表征了反馈图和通信网络之间强产品的独立性数量的遗憾。我们的分析恢复为特殊情况,许多先前已知的界限用于与专家或强盗反馈分布式在线学习的界限。我们的结果的更详细版本还捕获了遗憾对信息遍历每个图所花费的延迟的依赖性。在合成数据上运行的实验表明,我们算法的经验行为与理论结果一致。
translated by 谷歌翻译
我们考虑通过顺序查询其(可能扰动的)值,在紧凑型结构域上最大化非concave Lipschitz多元函数的问题。我们研究了Piyavskii和Shubert在1972年最初设计的天然算法,为此,我们证明了有关达到或证明给定优化精度所需功能的评估次数的新范围。我们的分析使用了强烈的优化观点,并通过界定评估数量来证明给定准确性的数量接近封装数量,从而解决了Hansen等人(1991)的开放问题。
translated by 谷歌翻译
我们在反复决策中介绍了一种新颖的投资回报(ROI)最大化的理论框架。我们的环境受到使用案例的,公司经常接受技术创新建议,并希望快速决定是否值得实施。我们设计一种在一系列创新建议上学习ROI最大化决策政策的算法。我们的算法以$ \ min \ big \ {1 /(n \ delta ^ 2),n ^ {-1/3} \} $,其中$N $是创新的数量,$ \ delta $是$ \ pi $的次优差距。我们配方的一系列重大障碍,它将其从其他在线学习问题(如Burdits)中设置,是运行策略不提供对其性能的无偏见估计。
translated by 谷歌翻译
An Anomaly Detection (AD) System for Self-diagnosis has been developed for Multiphase Flow Meter (MPFM). The system relies on machine learning algorithms for time series forecasting, historical data have been used to train a model and to predict the behavior of a sensor and, thus, to detect anomalies.
translated by 谷歌翻译
Diffusion models have achieved justifiable popularity by attaining state-of-the-art performance in generating realistic objects from seemingly arbitrarily complex data distributions, including when conditioning generation on labels. Unfortunately, however, their iterative nature renders them very computationally inefficient during the sampling process. For the multi-class conditional generation problem, we propose a novel, structurally unique framework of diffusion models which are hierarchically branched according to the inherent relationships between classes. In this work, we demonstrate that branched diffusion models offer major improvements in efficiently generating samples from multiple classes. We also showcase several other advantages of branched diffusion models, including ease of extension to novel classes in a continual-learning setting, and a unique interpretability that offers insight into these generative models. Branched diffusion models represent an alternative paradigm to their traditional linear counterparts, and can have large impacts in how we use diffusion models for efficient generation, online learning, and scientific discovery.
translated by 谷歌翻译